Şu anda bir XML çeşidi için temel bir ayrıştırıcı yazıyorum. Alıştırma olarak, LL tablosu tabanlı bir ayrıştırıcı uyguluyorum. Bu benim BNF dilbilgisi örneğim: % simge adı veri dizesi %% / * LL (1) * / doc: elem elem: "<" open_tag open_tag: ad attr close_tag close_tag: ">" elem_or_data "" ad ">" | "/>" ; elem_or_data: "<" open_tag elem_or_data | veri elem_or_data | / * epsilon * / ; attr: ad ":" dize öznitelik | / * epsilon * / ; Bu dilbilgisi doğru mu? Her uçbirim değişmezi tırnak işaretleri arasındadır. Soyut uçbirimler% belirteci ile belirtilir. Girdiğimi bir simge listesine dönüştürmek için elle yazılmış bir sözlüğü kodluyorum. Soyut terminalleri nasıl belirtebilirim?
2021-03-03 08:12:34
Klasik yaklaşım, olası her uçbirim için bir düzenli ifade (veya başka bir tanıyıcı) yazmak olacaktır. Tamamen somut olan "soyut" terminaller dediğiniz şey, aslında ilişkili kalıpları birden fazla olası girdi dizgesini tanıyan terminallerdir. Gerçekte tanınan dize (veya bu dizenin bazı hesaplanan işlevleri), belirtecin anlamsal değeri olarak ayrıştırıcıya aktarılmalıdır. Nominal olarak, giriş dizesindeki her noktada, belirteç tüm tanıyıcıları çalıştıracak ve en uzun eşleşmeye sahip olanı seçecektir. (Bu, sözde "maksimal munch" kuralıdır.) Bu, özellikle tüm desenler düzenli ifadeler ise, genellikle optimize edilebilir. Örneğin (F) lex bu optimizasyonu sizin için yapacak. Sizin durumunuzdaki bir komplikasyon, dilinizin belirtilmesinin içeriğe bağlı olmasıdır. Özellikle, hedef elem_or_data olduğunda, olası tek simgeler <, ve "data" dır. Ancak, bir etiketin içinde "veri" mümkün değildir ve "ad" ve "dize" etiketleri mümkündür (diğerleri arasında). Bir özniteliğin değerinin anahtarla aynı sözcük biçimine (yani bir ad) sahip olması da mümkündür. XML'in kendisinde, öznitelik değeri tırnak içine alınmış bir dize olmalıdır ve tırnaksız bir dizenin kullanımı bir hata olarak işaretlenir, ancak kesinlikle boşluksuz öznitelik değerlerinin eklenebileceği "XML benzeri" diller (HTML gibi) vardır. alıntı yapılmamış. Sözcüksel analiz bağlama bağlı olduğu için, sözcüksel çözümleyiciye sözcüksel bağlamı tanımlayan ek bir bilgi aktarılması (veya erişiminin olması) gerekir. Bu genellikle, döndürülen son birkaç simgeye veya geçerli ayrıştırıcı yığınının İLK kümesine dayalı olarak hesaplanabilen tek bir numaralandırma değeri olarak temsil edilir. 2 | senin cevabın StackExchange.ifUsing ("editor", function () { StackExchange.using ("externalEditor", function () { StackExchange.using ("parçacıklar", işlev () { StackExchange.snippets.init (); }); }); }, "kod parçacıkları"); StackExchange.ready (function () { var channelOptions = { etiketler: "" .split (""), id: "1" }; initTagRenderer ("". split (""), "" .split (""), channelOptions); StackExchange.using ("externalEditor", function () { // Snippet'ler etkinse, snippet'lerden sonra editörü çalıştırmanız gerekir if (StackExchange.settings.snippets.snippetsEnabled) { StackExchange.using ("parçacıklar", işlev () { createEditor (); }); } Başka { createEditor (); } }); function createEditor () { StackExchange.prepareEditor ({ useStacksEditor: false, heartbeatType: 'answer', autoActivateHeartbeat: yanlış, convertImagesToLinks: true, noModals: true, showLowRepImageUploadWarning: true, reputationToPostImages: 10, bindNavPrevention: true, postfix: "", imageUploader: { brandingHtml: "Destekleyen \ u003ca href = \" https: //imgur.com/ \ "\ u003e \ u003csvg class = \" svg-icon \ "width = \" 50 \ "height = \" 18 \ "viewBox = \ "0 0 50 18 \" fill = \ "yok \" xmlns = \ "http: //www.w3.org/2000/svg \" \ u003e \ u003cpath d = \ "M46.1709 9.17788C46.1709 8.26454 46.2665 7.94324 47.1084 7.58816C47.4091 7.46349 47.7169 7.36433 48.0099 7.26993C48.9099 6.97997 49.672 6.73443 49.672 5.93063C49.672 5.22043 48.9832 4.61182 48.1414C.61182C47.4335 4.61182 4.23.623 43.1481 6.59048V11.9512C43.1481 13.2535 43.6264 13.8962 44.6595 13.8962C45.6924 13.8962 46.1709 13.2535 46.1709 11.9512V9.17788Z \ "/ \ u003e \ u003cpath d = \" M32.492 10.14.94723.048 12.6954.072.048 41.5985 12.6954 41.5985 10.1419V6.59049C41.5985 5.28821 41.1394 4.66232 40.1061 4.66232C39.0732 4.66232 38.5948 5.28821 38.5948 6.59049V9.60062C38.5948 10.8521 38.2696 11.5455 37.0451 11.5455 521 35.4954 9.60062V6.59049C35.4954 5.28821 35.0173 4.66232 34.0034 4.66232C32.9703 4.66232 32.492 5.28821 32.492 6.59049V10.1419Z \ "/ \ u003e \ u003cpath fill-rule = \" çift = \ "M25.6622 17.6335C27.8049 17.6335 29.3739 16.9402 30.2537 15.6379C30.8468 14.7755 30.9615 13.5579 30.9615 11.9512V6.59049C30.9615 5.28821 30.4833 4.66231 28.4502 4.66231C28.99 4.66231 4.5009 .1369 4.56087 21.0134 6.57349 21.0134 9.27932C21.0134 11.9852 23.003 13.913 25.3754 13.913C26.5612 13.913 27.4607 13.4902 28.1109 12.6616C28.1109 12.7229 28.1161 12.7799 28.121 12.985.1321 15.2321 24.1352 14.9821 23.5661 14.7787C23.176 14.6393 22.8472 14.5218 22.5437 14.5218C21.7977 14.5218 21.2429 15.0123 21.2429 15.6887C21.2429 16.7375 22.9072 17.6335 25.6622 17.933524.13.9917 27.2119 7.09766 28.0918 7.94324 28.0918 9.27932C28.0918 10.6321 27.2311 11.5116 26.1024 11.5116C24.9737 11.5116 24.1317 10.6491 24.1317 9.27932Z \ "/ \ u003e \ u003cpath d = 17.951213.8962C19.3298 13.8962 19.8079 13.2535 19.8079 11.9512V8.12928C19.8079 5.82936 18.4879 4.62866 16.4027 4.62866C15.1594 4.62866 14.279 4.98375 13.3609 5.88013C12.653 5.05154 11.658,251 4.6286.396 13.9157 13.2535 13.9157 11.9512V8.90741C13.9157 7.58817 14.3365 6.91179 15.4269 6.91179C16.4027 6.91179 u .31675 5.28821 2.83866 4.66232 1.82471 4.66232C0.791758 4.66232 0.313354 5.28821 0.313354 13.2535 3.316 75 11.9512V6. Z \ "fill = \" # 1BB76E \ "/ \ u003e \ u003c / svg \ u003e \ u003c / a \ u003e", contentPolicyHtml: "\ u003ca href = \" https: //stackoverflow.com/help/licensing \ "\ u003ecc by-sa \ u003c / a \ u003e \ u003ca href = \" https://stackoverflow.com altında lisanslanan kullanıcı katkıları / legal / content-policy \ "\ u003e (içerik politikası) \ u003c / a \ u003e", allowUrls: true }, onDemand: doğru, discardSelector: ".discard-answer" , hemenShowMarkdownHelp: true, enableTables: true, enableSnippets: true }); } }); Stack Overflow'a yanıt verdiğiniz için teşekkür ederiz! Lütfen soruyu yanıtladığınızdan emin olun. Ayrıntıları sağlayın ve araştırmanızı paylaşın! Ama kaçının ... Yardım istemek, açıklama yapmak veya diğer cevaplara cevap vermek. Görüşe dayalı açıklamalarda bulunmak; Bunları referanslarla veya kişisel deneyimlerle yedekleyin. Daha fazla bilgi edinmek için harika yanıtlar yazmaya ilişkin ipuçlarımıza bakın. Taslak kaydedildi Taslak silindi Kaydolun veya oturum açın StackExchange.ready (function () { StackExchange.helpers.onClickDraftSave ('# login-link'); }); Google kullanarak kaydolun Facebook kullanarak kaydolun E-posta ve Şifre kullanarak kayıt olun Sunmak Misafir olarak yayınlayın İsim Soyisim E-posta adresi Gerekli, ancak asla gösterilmiyor StackExchange.ready ( function () { StackExchange.openid.initPostLogin ('. Yeni giriş sonrası', 'https% 3a% 2f% 2fstackoverflow.com% 2fquestions% 2f54745855% 2ftokenize-abstract-terminalals-in-ll-grammar% 23new-answer', 'question_page' ); } ); Misafir olarak yayınlayın İsim Soyisim E-posta adresi Gerekli, ancak asla gösterilmiyor Cevabınızı Gönderin At "Cevabınızı Gönderin" seçeneğine tıklayarak, hizmet şartlarımızı, gizlilik politikamızı ve çerez politikamızı kabul etmiş olursunuz. Aradığın cevap değil mi? Ayrıştırma lexer bnf ll recursive-descent etiketli diğer sorulara göz atın veya kendi sorunuzu sorun.